Géostatistique

Marie-Pierre Etienne

ENSAI - CREST

https://marieetienne.github.io/statspat

2025-01-07

Introduction

Exemple illustratif

La température en France

Géostatistique

  • Domaine continu : \(D \subset \mathbb{R}^2\).
  • Processus stochastique : \(Z = \{Z(s)\}_{s \in D}\)
    • Collection de variables aléatoires indexées par \(s \in D\).
    • Données \(Z(s_1), Z(s_2), \ldots, Z(s_n)\) observés.

Objectifs :

  • Prédiction \(\widehat{Z}(s_0)\) de \(Z(s_0)\) ou intégrale \(\int_B Z(s)ds\).
  • Estimation de la loi de \(Z(s)\) ou d’une fonctionnelle \(\varphi(Z(s))\).
  • Estimation des relations de dépendance entre \(Z(s_i)\).

Estimation de la moyenne

Hypothèses

  • \(E(Z(s)) = \mu \quad \forall s \in D\)
  • \(\text{cov}(Z(s_i), Z(s_j)) = c_{ij}\)

Estimation

  • Observations : \(Z(s_1), Z(s_2), \ldots, Z(s_n)\).
  • Estimation de \(E(Z(s)) = \mu\) ?

Contraintes

  • Estimateur linéaire : \(\widehat{\mu} = \sum_{i=1}^n \lambda_i Z(s_i)\).
  • Sans biais : \(\text{E}(\widehat{\mu}) = \mu\).
  • Variance minimale : \(\text{Var}(\widehat{\mu} - \mu)\).

Estimation de la moyenne

  • Si \(\widehat{\mu}\) est sans biais alors

  • Quelle est la conséquence de l’hypothèse de variance minimale ?

Solution : Best Linear Unbiased Estimator (BLUE)

  • Minimisation : [ _{i,j=1}^n i j c{ij} ; {i=1}^n _i = 1 ]

Utiliser la méthode du multiplicateur de Lagrange et montrer qu’on cherche à résoudre le système linéaire

\[\begin{pmatrix} c_{11} & c_{12} & \dots & c_{1n} & 1 \\ c_{21} & c_{22} & \dots & c_{2n} & 1 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ c_{n1} & c_{n2} & \dots & c_{nn} & 1 \\ 1 & 1 & \dots & 1 & 0 \end{pmatrix} \begin{pmatrix} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_n \\ m \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{pmatrix}\]

Conclusion si \(c_{ij}\) connus, on peut estimer la moyenne

Encore faut il pouvoir estimer la covariance

Spécificité des données spatiales

  • on a souvent une seule réalisation du processus spatial

  • Il faut avoir des hypothèses de régularité spatial pour espérer dire des choses à partir d’une réalisation

Processus du second ordre

Définitions

  • \(Z\) est un processus du second ordre si \(\forall s \in D, \text{E}(Z(s)^2) < \infty\).
  • La moyenne de \(Z\) est la fonction \[\begin{align} m : D & \to {\mathbb{R}}\\ s & \to m(s) = {\mathbb{E}}(Z(s))) \end{align}\]
  • La covariance de \(Z\) est la fonction \[\begin{align} c : D\times D & \to {\mathbb{R}}\\ (s,t) & \to c(s,t) = {\mathbb{C}\text{ov}}(Z(s), Z(t)) \end{align}\]

Propriété Une fonction de covariance est semi définie positive i.e.

\[\forall a\in {\mathbb{R}}^n, \sum_{i,j}^n a_i a_j C(s_i, s_j)\geq 0\] Idée de preuve : Regarder \({\mathbb{V}\text{ar}}(\sum_{i=1}^n a_i Z(s_i))\)

  • \(Z\) est un processus gaussien si pour toute partie finie \(S \subset D\) et toute suite réelle \(a = (a_s , s\in S)\), \(\sum_{s\in S} a_s Z(s)\) est une variable gaussienne.

Processus stationnaire

Définition

Un processus de second ordre \(Z\) est stationnaire sur \(D\subset {\mathbb{R}}^d\) si

  1. Moyenne constante : \(\forall s\in D, \quad m(s) = \mu\).
  2. Covariance invariante par translation : \[\forall (s, t)\in D^2 c(s,t) = C(t - s) \quad \text{ou} \forall h; s+h \in D, \quad c(s,s+h) = C(h) \]

Isotropie

Un processus est isotrope si \(C(h)\) dépend uniquement de \(\|h\|\) i.e \[C(h) = C(\|h\|)\]

Stationarité des accroissements

\(Z\) est un processus à accroissements stationnaires si les accroissements de \(Z\) sont stationnaires au second ordre, i.e. \[{\mathbb{E}}(Z(s + h) − Z(s)) = 0\] \[{\mathbb{V}\text{ar}}(Z(s + h) − Z(s)) = 2\gamma(h)\] La stationnarité du second ordre implique la stationnarité des accroissements.

La classe des processus à accroissement stations est donc plus ….. que la classe des processus de second ordre. ### Exemple

Que dire du mouvement Brownien sur \({\mathbb{R}}\)

Variogramme

Définition

Le semi-variogramme d’un processus à accroissements stattionnaire est défini comme : \[\gamma(h) = \frac{1}{2} {\mathbb{V}\text{ar}}(Z(s+h) - Z(s))\]

Propriétés

  • \(\gamma(h) \geq 0\), \(\gamma(0) = 0\), \(\gamma(-h) = \gamma(h)\).
  • Si \(Z\) est stationnaire de second ordre : \[\gamma(h) = C(0) - C(h)\]
  • si \(lim_{|h|\to \infty} \gamma(h) = \ell < +\infty\) alors le processus est stationnaire du second ordre et \(\ell = C(0)\)

Variogramme

Variogrammes classiques

  1. Pépitique : \(\gamma(h) = C\)

  2. Exponentiel : \(\gamma(h) = C(1 - \exp(-\|h\|/\rho))\).

  3. Sphérique : \[\gamma(h) = \begin{cases} C \left( \frac{3}{2} \frac{\|h\|}{\rho} - \frac{1}{2} \left(\frac{\|h\|}{\rho}\right)^3 \right) & \text{si } \|h\| \leq \rho \\ C & \text{si } \|h\| > \rho \end{cases}\]

  4. Gaussien : \(\gamma(h) = C(1 - \exp(-\|h\|^2/\rho))\).

  5. Puissance : \(\gamma(h) = C\left | h\right|^\alpha, \alpha < 2\)

Un variogramme particulier

Classe de Matèrn

\[ \gamma(h) = C\left [ 1 - \frac{1}{2^{\nu -1}\Gamma(\nu)}\left(\frac{\sqrt{2\nu }h}{\rho}\right)K_{\nu}\left(\frac{\sqrt{2\nu }h}{\rho}\right)\right]\] \(K_{\nu}\) fonction de Bessel modifiée de 3ème espèce, d’ordre \(\nu\)

\(\nu\) paramètre qui règle la régularité en 0.

  • \(\nu\) = 1/2 : modèle exponentiel
  • \(\nu\to \infty\)

Exemple : Pluies suisses